AI032
Programación de procesadores altamente paralelos: Un enfoque práctico
Hilos y programación avanzados de CUDA
Objetivos de aprendizaje
- Analizar el papel del motor GigaThread en la distribución global de bloques entre multiprocesadores de streaming.
- Evaluar el impacto de la programación de warps y la asignación de instrucciones en la utilización de la pipeline.
- Optimizar el rendimiento del kernel equilibrando la presión de registros y la memoria compartida frente a la ocupación.
- Dominar primitivas de sincronización avanzadas y patrones de ejecución cooperativa de grupos.